好文荐读|刘华、梁姗姗:国际中文教育用框式结构分类分级研究
“语言学心得”新版块掉落~好文荐读(第十九期)国际中文教育用框式结构分类分级研究~
“好文荐读”不定期更新,为大家带来最新的核心期刊亮眼论文,希望大家多多支持,也欢迎给我们留言推荐更多值得一荐的好文哦~
刘 华 暨南大学华文学院
梁姗姗 中山市南头镇民安小学
文章简介
文章来源:刘华,梁姗姗.国际中文教育用框式结构分类分级研究[J].语言文字应用,2021(03):121-132.
摘要:本文首先总结了留学生汉语作文语料库中常用的 279 个母框式结构和 239 个子框式结构,并对其进行了分类与分级研究; 其次,结合分类与分级结果多维度分析了框式结构的重点语法类型; 最后,对框式结构的整体教学提出了建议,明确了各阶段、各等级框式结构学习类型的侧重点。
一、引言
现代汉语中有许多类似于“对_来说”这种超越词、短语和句子的特殊结构,这种介于句子和固定短语之间带的“框式结构”易学易用,能产性高,能提高学习效率和表达效果。
近年来,框式结构或语块、构式研究多集中于其重要性、语义及二语教学等方面,主要研究者有陆俭明( 2008) 、苏丹洁( 2010) 、邵敬敏( 2011) 、施春宏( 2017) 等,实证研究相对较少。在重要性研究方面,Widdowson( 1989) 指出词块对二语习得的意义更大; 丁言仁( 2005) 证明了词块对作文成绩的提高具有45%以上的解释力; 周健( 2007) 认为语块对地道表达、克服中介语及词汇搭配错误、提高留学生语用水平有积极作用; 邵敬敏( 2011) 提倡重视研究框式结构,推进《现代汉语框式结构词典》的编撰。语义研究集中在语义分析、语义特征、语义增值、语义偏移等方面。余俊宏( 2014) 研究了复杂框式结构“该_则_,该_则_”的语义特征及其对比凸显、典型事例两种语义增值方式; 李振中( 2008) 对5 种类型的框式结构进行语义分析描写。汉语作为二语的框式结构研究方面,吴双( 2012) 验证了经典诗文语块对留学生书面表达能力提升的有效性; 胡烈飞( 2017) 发现语块教学法对降低学生的语体偏误有积极影响; 刘娜( 2019) 针对高级写作课提出了针对不同文体,归纳相应语块的建议。
分级相关的研究聚焦在词表研制及分级阅读方面。苏新春( 2017) 论述了《义务教育常用词表( 草案) 》的词表性质与功能、规模与收词标准、分级、研制方法等问题; 张引兵等( 2020) 为了提高词表分级的可解释性与可移植性,使用贪心算法动态生成分级词表。目前,框式结构尚无较为科学的分级标准和详细的词典或分级表,框式结构分类分级表的建立至关重要。
本文基于暨南大学留学生汉语作文语料库,对“框式结构”进行了分类分级研究。通过具体的研究,对框式结构的整体教学提出了建议,明确了各阶段、各等级框式结构学习类型的侧重点; 提出国际中文教育框式结构教学的精简模式,分析了其作用并提出相关建议。
二、框式结构的界定、特征及其分类
( 一) 框式结构的界定
典型的框式结构,是指前后有两个不连贯的词语相互照应、相互依存而形成的框架式结构,具有特殊的语法意义和特定的语用功能( 邵敬敏,2008) 。本文将框式结构定义为一种具有常项和变项的特殊构式类型,变项可为词、短语或句子。具体界定如下:
1. 形式上,框式结构包括常项和变项,常项是固定的框式骨架,变项是填充部分; 2. 框式结构的意义由变项和常项两部分决定,常项承担逻辑义、情感义等附加意义,变项承担框式的基本意义; 3. 框式结构的变项和常项相互制约和联系,在不同语境中表现特定的语用功能。
框式结构包括母子两级框式结构。母框式结构是最基本、最具概括性的框式结构,母框式结构以词为单位继续填充,得到二级子框式结构,二级子框式结构进一步填充,得到再次一级的子框式结构,直至其填充为一个短语或者句子。例如,“_以来”作为母框式结构,可填充为“自从_以来”二级子框式结构,继续填充可得到“自从_到_以来”三级框式结构,以此类推,若已无变项,该结构则固定为短语或者句子。
同时,框式结构与语块、构式等概念相互联系又相互区别。语块强调“块”,语块中的聚合词、搭配词以及固定表达都不是框式结构; 框式结构强调“框”,若无变项,那么该结构也不再是“框式结构”。框式结构不同于构式,不是所有的框式结构都有明确的构式意义,普通框式结构构式义固化与变项的语境、频率等因素有关,且框式结构构式义的提取须经鉴别、概括、解释,是一个漫长的过程。
( 二) 框式结构的基本特征
1. 类聚特征
借用数学概念,框式结构是同类型短语或句子聚合后的“交集”。这类短语或句子整存整取的相同部分即为框式结构的常项,而框式外的可变部分即为框式结构的变项。若变项不变,无法类聚,则该结构不能称之为框式结构。
2. 意义特征
所使用的常项与变项应为合法的语言单位,在分词、词性正确的前提下,注重框式结构的意义内涵。
3. 能产特征
“框式结构”的能产性主要由变项来体现。使用同一框式的结构其常项相同而变项不唯一,某一变项出现频次过高则表明该结构的能产性相对较低。
4. 中介特征
框式结构可看作一个连续统,是不包含起点与终点的从固定结构到自由组合句子的连续统,该系统从起点到终点的能产性不断提高。
( 三 ) 框式结构的整理与标记
本文在周妮(2016) 归纳的 593 个框式结构的基础上,确定了分类标准,并进行了整理:
1. 按常项和变项的项数分类,按照实际情况确定变项与常项。例如,周妮( 2016) 认为“虽然_,_但是_”有2个常项与3个变项,而在实际语料中,第二个分句“但是”前面的变项基本不存在,“虽然_,但是_”( 2 个常项,2个变项) 更符合语料实际情况。
2. 对类似框式结构进行归并、拆分及整合。例如,“别说是_,连_都_”真包含于“别说_,连_都_”,因而进行合并。
3. 命名术语并进行标记。为方便计算机标识,本文使用以下符号对各术语进行标记,如表1 所示。
例如,“对_来说”大类标记为c2v1,表示有两个常项,一个变项; 具体类型标记为c1 v1c2,其中,c1表示第一个常项( “对”) ,v1表示一个变项( “_”) ,c2表示第二个常项( “来说”) 。
( 四 ) 框式结构的分类统计
本文将框式结构分为7 个大类、13 种具体类型。如表2 所示。
三、框式结构的排序与分级
( 一) 排序分级的基本原则
本文主要从常用性、难易度、实用性来排序分级。
1. 常用优先
常用性是分级的最重要因素。教学时,应当遵循“常用先教”的原则。使用频率越高的框式结构相对来说重要性越大,应给予高频框式结构足够的重视。
2. 由易到难
难易度是分级的重要标准。难度包括两个方面: 首先,不同框式结构的平均难度不同,当不同框式结构的常用性相同时,难度低的排在前面; 其次,同一框式结构下例句的难度、句子长短、词汇难易度,都会影响到框式结构分级。
3. 实用为主
分级应当尽量精确、细化。同时用较为简明的符号表示,将最终的分级结果科学地呈现,尽量做到简明易懂,能让学生学以致用,为教学服务。
( 二 ) 排序分级的原理与公式
1. 句子难易度计算
句子难易度计算,是框式结构分级的核心。句子难易度的计算,首先要考虑句中各词的平均难易度。词语的难易度与频次有关,同时也与词语在语料库中的时空分布密切相关。时间体现了词语在历时发展中的恒定情况,空间则体现使用人群和使用领域的分布均匀性,时间和空间上均匀分布的词语,是词语的核心部分。词语的频次越高,分布越均匀,相对来说,越常用,越容易,应该先教先学。
新HSK 词汇等级大纲的收词目的主要是想让少数词语分布到大部分的试题当中去,即少数常用词语覆盖大部分试题内容。同时,大纲本身也是主要依据词频( 或综合词频 ) 以及词语常用性进行排序分级的。因此,以词语难易度为计算基础的例句难易度与新HSK 词汇等级大纲在构建原理与目的上具有共通性。
刘华( 2010) 兼顾了词语的常用性、分布的离散程度以及生成能力三个因素,以此来模拟词汇“难易度”。见公式1。
其中,
刘华( 2010 ) 在计算句子难易度时综合考虑了句长、词汇平均难易度以及罕用词难易度这三个因素。见公式2。
其中,
排序是分级的前提。排序包括两层含义: 其一,对于例句数量大于2的框式结构,将该框式结构内部的所有例句按难易度由易到难排序,这个上一节已经实现。其二,设计框式结构分级值公式对框式结构进行难易度计算,在符合前文所提及的基本原则的基础上排序。见公式3。
其中
( 三 ) 框式结构的排序流程
框式结构的难度与很多因素有关,比如,框式结构中常项的难易度、变项中填充词语的难易度、例句中除常项和变项之外的上下文词语的难易度。从可计算的角度来看,某框式结构例句集的难易度的平均值是衡量该框式结构最重要的参数。框式结构的排序流程如下:
1.对于例句数量大于2 的框式结构,统计各框式结构的例句数量,统计所有框式结构的例句数量;
2.利用公式2,计算每一框式结构中各例句的难易度值,按从易到难顺序重新排列;
3.计算每一框式结构中各例句难易度值的平均值;
4.利用公式3,计算各框式结构的框式结构分级值;
5.依据框式结构分级值将所有框式结构按从易到难顺序重新排列。
( 四 ) 框式结构分级方法及实现
按照框式结构分级值对框式结构排序后,还需要对框式结构进行分级,即对于排序结果进行分段处理,每一级的框式结构的数量是多少,即每一段在哪里分割,这是分级最重要的问题。
由图1 可知,分级值排名靠前的少数框式结构包含着框式结构绝大多数的语料,适合先学先用。另外,图中分级值有明显的断层现象,分级学习十分必要,成为本文进行分级的重要依据。
1. 母框式结构分级表构建
《新汉语水平考试大纲》对新汉语水平考试命题具有指导性作用,其分级标准制定也较为成熟,框式结构的常项本身就是由词语组成,且框式结构与新HSK 大纲都遵循常用优先,由易到难的原则。因此,本文参照此分级标准进行分级。
张洁、张晋军( 2010) 基于2006 ~ 2009年正式考试中使用过的3l 套HSK( 基础)试卷、34 套HSK( 初中等) 试卷、34 套HSK( 高等) 试卷的统计分析,对新汉语水平考试的用词进行了调整,将原来的三级标准( 基础、初中等、高等) 变为了现在的六级③。本文根据以往HSK 考试的高频词覆盖各等级试题的内容来对词表重新分级,并以覆盖HSK( 基础)试题内容约50%作为切入点确定一级词汇量,后面级别的词汇量按照覆盖率10% 的规律递增,以此确定各级别的词汇数量,如表3 所示。
上文提到,框式结构分级排序的基本原则中,常用性是分级最重要的因素,常用性通过各框式结构中的例句数量来确定。操作上,我们以母框式结构对应的例句数量为参照,所有母框式结构按难易度从易到难排序后,一级取所有母框式结构的例句数量覆盖率的前约50%,即18818个例句,为切入点,以此确定一级母框式结构的数量,即所有母框式结构的前14 个,并按照约10%的递增规律将母框式结构分成6 级。
表4 中的覆盖率等于该等级母框式结构例句数量除以所有级别的母框式结构例句数量,如48. 75%等于18818 除以38600; 母框式结构累加数量是该等级母结构数量及前面所有等级母结构数量的累加,例句累加数量是该等级母结构对应的例句数量及前面所有等级母结构对应例句数量的累加。一级中,当母框式结构数量为14 个时覆盖率为48. 74%,最靠近50%,因此我们取14,其余级别的覆盖率取值同此方法。
2. 子框式结构分级表构建
高频的子框式结构能产性强、常用性高,可以更好地帮助教学。本文根据语料,按照子框式结构例句出现的比例,整理了二级子框式结构,这些二级子框式结构满足以下三个条件:
( 1 ) 有框式含义。在该子框式结构的变项中可以有多种不同的填充方式,能产性强。
( 2 ) 子框式结构与母框式结构是非包含的关系,不重叠。
( 3 ) 常用度高。对于例句数大于9 的母框式结构,只取那些例句数量大于或等于母框式结构10%例句数量的子框式结构; 对于例句数量小于10 的母框式结构,只取那些例句数量大于或等于母框式结构50%例句数量的子框式结构。
例如母框式结构“如果_,_就_”有715 条例句,包含“如果_不_,_就_”“如果_的话,_就_”“如果_没_,_就_”这三个二级子框式结构,他们的例句数量均超过了90 条,所占比例都在10%以上,因此这三个二级子框式结构都应该取。
最终整理出二级子框式结构239 项。限于篇幅,此处仅展示等级为一级的框式结构分级表,如表5 所示。
四、常用框式结构分级表分析
( 一 ) 母框式结构等级与框式大类及具体类型的分析
框式结构的常项、变项与框式等级关系密切。根据前文对框式结构的分类,本文着重分析各等级框式结构的优势类型。
据表2 和图2,从一级到六级,框式结构的类型也逐渐从c1v1 向c2v1、c2v2、c2v3、c2v4 过渡,数量渐渐增多( 如图2) 。我们知道,框式结构类型中,随着常项( 如c2) 数量,特别是变项( 如v2) 数量的增加,难度也随之提高。这再次证明了框式结构的6级分级是科学合理的。
整体上看, c2v1 和c2v2 两种类型在六个等级均有分布,c2v1 类型的框式结构在各等级的分布更为均匀,其具体类型唯一,即c1v1c2。经统计,虽然c2v1型的框式结构数量不是最多的,但其例句在总语料数量中占38. 53%,可见, c2v1 类型的框式结构常用且十分重要。
c2v2 框式结构数量最多,其中介词结构与关联词类型较多,分布于各等级,尤以中高级阶段数量最多,中高级主要是关联词型框式结构。
c2v3 类型的框式结构与c2v2 数量相当,其具体类型主要是关联词型框式结构,因其变项增多,相对更难掌握,因此集中于高级阶段。
c1v1 类型的框式结构有c1v1 和v1c1 两种具体类型。c1v1 类型看似形式最简单,但是其开放性比c2v1 类型的框式结构更强,变项填充的单位更复杂多样,相对更难掌握。
c2v4、c3v3、c4v2 三种具体类型都较单一,分别为“v1 c1 v2,v3 c2 v4”“c1 v1,c2 v2 c3 v3”“c1 v1 c2,c3v2c4”。这三种类型框式结构的常项、变项多,难度较高,在前五级中均未出现,是高级阶段( 第六级) 学习的提升型框式结构。
( 二 ) 母框式结构等级与语法结构类型的分析
1. 母框式结构语法类型整体概述
本研究使用刘华( 2021) “汉语助研”结合北京大学多领域分词工具包Pkuseg 进行词性标注,并通过人工校对,详细标注了各框式常项的词性,并据此分析母框式结构等级与框式结构语法结构类型的关系,如表6 所示。
经统计分析,各等级出现次数最多的语法结构类型是介词结构和关联词。这两种类型的框式结构的例句数量同样明显占优势,但是在不同等级中这两种类型各有所侧重,如图3 所示。
介词结构和关联词结构贯穿于框式结构学习的各个阶段,这两种类型框式结构的语料数量占各等级框式结构比例介于38. 72% ~ 75. 99%之间。
介词结构分布于各等级,在前三个等级占比最大,为初、中级框式结构的学习重点,从四级开始重要性逐渐降低。关联词框式结构从三级开始数量稳步上升,在四级时超越介词结构,成为后三阶段中最重要的框式结构。这种此消彼长的发展趋势( 介词结构比例逐渐下降,关联词结构逐渐上升) 也证明了我们六级分级模式的科学合理性。
从原因上分析,介词结构多限定于分句内部,关联词结构则大多跨分句,相对来说,跨距更大,难度也更大,因而形成了上述的此消彼长的发展趋势。
2. 关联词母框式结构详细分析
按照关联词的词性和位置,本文对关联词类的框式结构进行了再分类。分别有: 双连词型、连词副词组型、短语型、双副词型。其中两个副词组合的关联词语,在过去的研究中大多被忽视( 张文贤、邱立坤, 2007) 。而实际上,关联副词是连接两个复句很重要的手段。另外,连词和副词组合的关联词有些副词在前,有些副词在后,为了使统计结果更加精确,本文将这两种类型分开统计,按照连词、副词出现的顺序命名为连词副词型关联词、副词连词型关联词。不同类型关联词按照平均分级值降序排列,如表7 所示。
由表7 可知,连词副词型关联词框式结构的数量最多,这是因为副词与连词是衔接复句的重要手段,这与张文贤、邱立坤的研究结果是一致的。连词和副词关联词组合的框式结构虽然数量最多,但并不代表其重要性最高。由表7 可见,双连词型关联词框式结构的平均分级值远高于连词副词组合型框式结构。平均分级值越大,重要性越大,相对难度越低。从整体上来说,双连词型的关联词框式结构对框式结构教学意义更大。
连词与副词型衔接的框式结构中,连词与副词的位置很重要。连词副词型关联词与副词连词型关联词数量相比,数量多而且分级值高,相对容易掌握。此外,两个副词衔接复句的数量最少且分级值最低,难学难用,平时教学涉及不多。
( 三 ) 形似母框式结构的处理与分析
本文母框式结构既包括“虽然_,但是_”,也包括常用性较低( 级别较高) 的“虽然_,但_”,如表8 所示。这些形似框式结构式变项数量与位置相同,常项仅一处在意义与形式上有细微差别。教师根据分级结果,从相似框式结构变项性质入手,遵循先易后难的原则,根据教学阶段恰当选词,能更有效地指导学生使用框式结构,教学效果更佳。
( 四 ) 二级子框式结构分析
1. 母、子框式结构的等级比例关系分析
子框式结构为母框式结构的教学使用提供了具体范式,有利于学生通过代表性实例更快掌握母框式结构。上文从宏观上分析了各等级框式结构的特征,我们还需从微观上分析子框式结构的类型及特点。
由图4 可知,初、中级阶段每个母框式结构所拥有的子框式结构呈上升趋势,各等级平均子结构的比例逐步提高,四级达到最高,高级阶段才逐步下降,其中5 到6级陡降。由图4 柱线可知,六级中的母、子框式结构虽然最多,但由于该等级各框式结构的例句最少,很多子框式结构缺乏常用例句,母框式结构因而也缺乏高频的子框式结构,没有使用范式参考,学生学习的难度就大大提升了。
2. 母、子框式结构填充项的分析
子框式结构是由母框式结构的变项部分填充( 或部分填充) 为常项的结果,填充特征明显。本文对填充部分的词性进行了统计。
由图5 可知,填充部分词性按照数量多少排序依次为: 动词、副词、代词……
( 1 ) 其中,填充动词的结构中有十处为动词“是”,而在动词“是”前一般紧挨连词,出现次数最多的连词是“不仅”和“不只”,各出现三次,“不仅是”和“不只是”常作为整体出现; 趋向动词的情况出现六次,其中,“出”出现了四次,并且三次与介词“从”搭配,即“从_出”。
( 2 ) 在填充副词的框式结构中,出现的次数最多的副词依次是: 还、不、就、也……; 前四个副词出现的频次分别为: 10、9、6、4。
“还”作为关联词出现7 次,且在复句的第二个分句与其他关联词搭配。“不”出现次数也较多,放在动词或形容词之前表示否定,这9 个含有“不”的子框式结构平均占母框式结构的比例为30. 52%,而用否定副词“没”的二级子框式占母框式结构的平均值为12. 71%,不管从出现的次数还是子框式占母框式的比例来看,“不”的使用率都超过了“没”。与“就”搭配得较多的是“那”和“像”,“就”与“那”搭配放在“那”之后,通常是出现在复句的第二个分句,起顺承的作用。“就”与“像”组合置于“像”前,组合成“就像_一样”“就像_似的”。“也”同样是在带有关联词的第二个分句中起衔接的作用。
( 3 ) 在填充代词的框式结构中,出现频率最高的三个词是: 我、什么、这。
以“我”开头的高频子框式结构有11 个,平均占母框式结构的33. 04%,所占比例较高,包含“我”的结构更多的是叙述,不带有明显感情色彩。相比之下,以第二、三人称叙述的高频二级框式就少得多了,例如,“他”出现两次,分别是“让_给他_”与“叫_给他_。填充了“什么”的子框式结构均没有疑问语气,表示任指的情况居多,如“什么”与“无论”或“不管”组合,其结果具有周遍意义。
指示代词“这”“那”作为子框式结构均可与介词“在”“从”搭配并置于其前,两者占母框式结构的平均比例相差不大,分别为25. 87%和22. 35%。“在_时候”的子框式结构可分别填充这两个代词,“在这_时候”,“在那_时候”分别占37. 04%、19. 26%。不过,并不是所有结构中,“这”都占优势,例如,“从_以后”的高频子框式结构有“从那_以后”,没有“从这_以后”。
五、框式结构教学建议
( 一 ) 循序渐进学习精简的常用框式结构
本文归纳的279 个框式结构应按照分级表顺序进行教学,结合表4 的分级结果,本文根据覆盖率、常用度对框式结构教学进行了优化,提出了框式结构教学的精简模式,如图6 所示。
图6 框式结构教学精简模式
学生可根据自己的需求选择框式结构进行学习。初级水平只需掌握前21 个框式结构,随着学生学习框式结构级别越来越高,每一等级所需要掌握的框式结构数量也不断增加。此框式结构精简分级模式遵循了循序渐进规律,有利于增强学习自信。
( 二 ) 注意处理框式结构的细节
首先,框式结构要命名正确,尤其要明确常项和变项的界限,复局中标点的位置; 其次,教师应参照典型子框式结构并依据框式结构排序结果依次选例; 再次,形似框式结构依据分级结果教学,分析变项特点,使得学生能理解两结构的不同点。最后,对能产性低且二级框式子结构多为固定结构的框式结构,教师应先从固定结构入手拓展。
( 三 ) 合理分配框式结构教学资源
初级框式结构总数数量只有14 个,但它们的搭配方式多,覆盖面广,学生要多接触各种类型的例句,学习所耗时间较长。随着学生使用框式结构越来越熟练,教师可充分利用中级框式中的结构丰富的子框式结构进行教学。高级尤其是六级框式结构学习,则需要更加重视母框式结构,教师应保证有足够的输入文本来促进学生合法输出。
六、结语
框式结构的分类分级研究对于考察留学生汉语输出中的框式结构的使用情况、评价框式结构运用在第二语言习得中的作用与价值,研究框式结构教学、培养学生汉语语感以及提高汉语教学效率等方面具有重要的意义与价值。
当然,本文还存在一些不足: 一是本文所选取语料针对性较强,主要基于留学生汉语作文的书面语,语料较片面。二是主要基于语法的显性结构形式研究,未涉及框式结构语义、隐形结构的分析。三是利用算法进行分级,未加入相关行业专家和教师的人工干预。四是对框式结构能产性的两端进行了描述,对处于中间阶段的框式结构的分析不够。
作者简介
刘华,暨南大学华文学院教授,博士,主要研究计算语言学、国际中文教育。
梁姗姗,中山市南头镇民安小学,主要研究国际中文教育。
本文来源:《语言文字应用》
点击文末“阅读原文”可跳转下载往期推荐
好文荐读|刘国辉、张卫国:语言经济学研究的方法及其实践路径
项目申报|2021年度《国际中文教育中文水平等级标准》教学资源建设项目
刊讯|SSCI 期刊《多元语言和多元文化发展》2021年第8期
刊讯|《外语教育研究前沿》2021年第3期(留言赠刊)
欢迎加入
“语言学心得交流分享群”“语言学考博/考研/保研交流群”
今日小编:薛定谔牌学习机
审 核:心得小蔓
转载&合作请联系
"心得君"
微信:xindejun_yyxxd
点击“阅读原文”可跳转下载